最終更新日:2024/07/24
Geminiとは?料金や使い方を紹介「Gemini(ジェミニ)」は、2023年12月にGoogleから発表された生成AIモデルです。2024年2月には、同社のAIサービスである「Bard」がGeminiへと統合され、最上位バージョンもリリースされるなど急速な進化を遂げており、生成AI業界の新たな進歩を示しています。
本記事では、Geminiの料金や使い方、活用事例など概要について詳しく解説します。2024年5月公開の最新モデルやその機能についてまとめていますので、自社におけるAIサービスの活用を検討する上でぜひ参考にしてください。
Googleの「Gemini(ジェミニ)」とは「Gemini(ジェミニ)」は、2023年12月にGoogleが開発した高機能生成AIモデルです。テキストや画像、音声、動画を用いて、チャット形式で簡単に高度なタスクを指示できます。
そもそもマルチモーダルAIとはGeminiは「マルチモーダルAI モデル」と呼ばれます。マルチモーダルモデルとは、テキストから画像、音声、動画といった、複数の異なるデータを同時に学習、処理できるように統合されたAIモデルのことです。
マルチモーダルAIの例には、大規模言語モデル(LLM)に画像入力を対応させることで進化したOpenAIの「GPT-4」などがあります。種類の異なる情報やデータを行き来し、関係性を作りながら推論する能力を、自然言語処理技術と組み合わせることで、より自然で効率的なタスク処理の実現が期待されています。
Geminiの3つのモデルGeminiには現在、「Gemini Ultra」「Gemini Pro」「Gemini Nano」という3種類のモデルが存在します。各モデルの主な特徴は、以下の通りです。
Gemini Ultra:最も新しい最上位モデルで、高度で複雑なタスクにも対応可能Gemini Pro:幅広いタスクに対応する最良モデル、応答時間の短縮も実現Gemini Nano:スマートフォン(Pixel 8など)上での利用を想定したモデルGoogleは、Geminiを「データセンターからモバイル端末まで柔軟に利用できるモデル」と位置づけており、用途や活用シーンに応じて種類を選ぶことで最適な利用環境を提供します。
GeminiとBardは何が違う?Googleは、ChatGPTに対抗するように、Gemini以前に「Bard」という名称のAIチャットサービスを提供していました。Geminiのリリース当初は、Bardとは別のサービスとして提供されていましたが、2024年2月のGemini Ultra 1.0の登場と共に、BardそのものがGeminiへと変更されたと発表されています。
現時点ですでに「Google Bard」と検索するとGeminiが表示されます。
Geminiの料金Geminiの料金は、2024年2月時点で無料です。Googleアカウントを持っている場合は、無料登録することで回数制限なしで自由に使えます。上位バージョンの「Gemini Advanced」にアップデートすると、月額2,900円で無料版よりも便利な機能を利用することが可能です。
また、開発者向けの「Gemini API」を利用してGemini Proを使う場合には、別の料金体系が適用されます。公表されている価格は以下の通りです。
処理方法金額テキスト入力0.00025ドル(約0.035円)/ 1,000文字画像入力0.0025ドル(約0.35円)/ 1画像テキスト出力0.0005ドル(約0.071円)/ 1,000文字Geminiが他のAIモデルより優れている点Googleは、Geminiが「テキスト、画像、音声、動画のベンチマークテストで最高水準を達成した」と公表しています。Geminiと他のAIモデルとの具体的な相違点としては、以下があります。
自然言語処理の能力(複雑な文脈やニュアンスの理解度)学習と進化の速度応用可能なジャンルや分野Geminiでは、マルチモーダルを用いて当初より異なるデータで事前学習させると共に、追加のマルチモーダルデータを使用しファインチューニングを行っています。その結果、あらゆる種類の入力をシームレスに理解し、高度な推論やコード生成にも対応できています。
また、Geminiでは以下のような機能を備えている点も特徴です。
Google検索によるWeb上の参照ソースの提示1度に提示する回答数が3つ位置情報の反映出力結果のエクスポート外部サービスとの連携(Google ドキュメントやGoogle Maps)外部ファイルの読み込み(Google ドキュメント・スプレッドシート)Geminiの使い方Geminiは、Googleアカウントを使って簡単に始めることが可能です。主な手順は、以下の3ステップです。
Google Geminiにアクセスする利用規約に同意するGeminiのチャット画面でプロンプトを入力するGoogleアカウントをまだ持っていない場合には、Googleアカウントを登録した後、Geminiにアクセスしましょう。
まず、Google GeminiのWebサイトを開きます。Googleの検索バーに「Gemini」と入力することでもすぐにページを開けます。「Geminiを試す」というボタンをクリックしましょう。
「利用規約とプライバシー」が表示されたら、下までスクロールします。
右下の「同意する」ボタンをクリックして進みます。
これで、Geminiの登録は完了です。以下の画面が表示されたら、メール配信を希望する場合はチェックを入れて「続ける」を選択しましょう。
チャット画面が表示されたら、プロンプトを入力していきます。
GeminiでできることGeminiでは、チャット形式で質問やタスク処理を入力することが可能です。具体的なできることとしては、以下が挙げられます。
文章の作成、要約、翻訳校正、編集論文や数学など問題の解説形式に沿ったテキストの作成プログラミングコードの自動生成画像認識、内容の解説音声入力画像生成Googleアプリとの連携すでにGeminiは日本語に対応していますが、内容によっては英語入力により出力精度が上がる場合があります。
Geminiの活用事例7選ここからは、Geminiの活用事例を7つ紹介します。企業やビジネスにおいて、どのような用途やシーンでGeminiが使えるのか、具体的な使い方の例を説明しますので、参考にしてください。
スライド資料や画像の内容をテキストにまとめるGemini では、画像解析機能を用いて内容の要約やまとめを簡単に作成できます。例えば、スライド資料をアップロードし、プロンプトに「内容を説明してください」と入力するだけで、わかりやすく文章化してもらうことが可能です。
スライドには書かれていないような関連情報も付け足してくれるので、回答だけを読んでも内容を理解できる状態になります。情報量の多い資料や専門領域に特化した資料も、画像解析を活用することで、中身を把握できるでしょう。
また、文字を含まない写真やイラストといった画像の説明を依頼することも可能です。例えば、画像データをアップロードし、プロンプトで「画像について教えて下さい」と質問するだけで、文章で解説してもらえます。
ただ、現時点では人物など対応していない要素やテーマも存在するため注意しましょう。
手書きメモの要約・解説Geminiは、画像だけでなく手書きのテキストや図も解析できます。この機能を活用することで、画像の内容を詳しく説明したり、要約としてまとめたりといった作業がスピーディに完了します。
例えば、電話を受けた際のメモを要約し、まとめてグループチャットに掲載すれば、情報共有が圧倒的に効率化します。また、出先での走り書きを画像データに起こしてGeminiにアップロードすることで、短時間で簡単にまとめを作成できます。
他にも、手書きアンケートの集計や案内図の清書など、さまざまな用途で活躍が期待できます。
URLからWebページの要約を作成Geminiでは、WebページのURLから記載されている内容を自動要約することが可能です。ChatGPTなど他のAIサービスでは、URLからWebサイトの名称やページタイトル、内容を読み取ることには対応しておらず、記載内容を自分で調べる必要がありました。
一方、Geminiでは該当ページのURLを貼りつけ、プロンプトとして「このWebページの内容を説明してださい」と入力するだけで回答が得られます。
海外のWebサイトの情報を知りたい場合や、専門的なWebページを解読したいときも、Geminiを利用することで簡単に読み取れるようになるでしょう。情報収集の効率化に役立ちます。
ブログ・メディアの記事や企画の複数提案Geminiは、1つのプロンプト入力に対して、3つの回答を同時に提案してくれます。ブログやメディアに